基础模型(FMS)已证明了前所未有的功能,包括零拍学习,高保真数据合成和范围内的概括。但是,正如我们在本文中所显示的那样,FMS在专家任务上的开箱即用表现较差(例如,从语言查询中检索汽车手册技术插图),数据是看不见的,或者属于长尾的数据用于FM预训练的大型数据集的数据分布的一部分。这强调了在此类专家任务上明确评估和芬太尼FMS的必要性,这可以说是在实际现实世界中最重要的任务。在本文中,我们提出了围绕教授FMS了解技术文档的任务,通过学习将其图形插图与相应的语言描述相匹配的任务围绕着了解技术文档的任务。我们的FETA基准重点是公共汽车手册和销售目录手册中的文本对图像和图像到文本检索。 FETA配备了完全自动注释提取的程序(接受后将发布代码),从而使Feta轻松扩展到将来更多的文档类型和应用域。我们的自动注释导致自动性能指标显示,该指标与在人类策划注释中计算的指标一致(也发布)。我们提供多个基线和对FETA的流行FM的分析,从而导致一些有趣的发现,我们认为这对FM社区非常有价值,为现实世界中FMS应用于当前被标准基准的“忽视”的实践专家任务铺平了道路。在常见对象上。
translated by 谷歌翻译
概括跨越不同视觉域的学习表现的能力,例如在真正的照片,剪贴画,绘画和草图之间是人类视觉系统的基本容量。在本文中,不同于利用一些(或全部)源域监控的大多数跨域工作,我们接近一个相对较新的,非常实用的无监督域泛化(UDG)设置在既不源也不在源域中没有培训监督。我们的方法是基于跨域(BRAD)的桥梁​​的自我监督学习 - 辅助桥域附有一组从每个训练域的Brad将视觉(图像到图像)映射保留的一组语义。 BRAD和MAPPAPAPPED(端到端)与对比的自我监督表示模型一起学习(端到端),其用语义对齐每个域将每个域对齐,因此隐含地驱动所有域(见或看不见)语义上彼此对齐。在这项工作中,我们展示了如何使用边缘正则化的布拉德,我们的方法在多个基准和一系列任务中实现了显着的增益,包括UDG,少量UDA和跨多个域数据集的无监督概括(包括指向未经看明域的概念和课程)。
translated by 谷歌翻译
存储在文档中的信息的数字转换是知识的伟大来源。与文本文本相比,嵌入式文档图形的转换,例如图表和地图,已经探讨了。我们介绍了一种方法和系统,用于将文档图表的端到端转换为机器读取的表格数据格式,可以在数字域中容易地存储和分析。我们的方法提取和分析图表以及其图形元素和支持结构,例如图例,轴,标题和标题。我们的检测系统基于神经网络,完全培训了合成数据,消除了数据收集的限制因素。与以前的方法相反,我们的网络使用边界盒检测图形元素,我们的网络特征辅助域特定的热带预测,可以精确地检测不适合矩形边界推定的饼图,线和散点图。定性和定量结果显示出高的稳健性和精确度,改善了以前的流行基准
translated by 谷歌翻译
判别特征反馈是Dastupta等人提出的设置。 (2018年),该协议提供了基于人类老师提供的功能解释的交互式学习协议。这些功能区分了可能类似实例对的标签。这项工作表明,在基于标准标签的交互式学习模型中,在此模型中学习可以具有相当大的统计和计算优势。在这项工作中,我们为判别特征反馈模型提供了新的鲁棒交互式学习算法,其错误界限明显低于此设置的以前可靠算法。在对抗性环境中,我们减少了对协议异常数量的依赖性,从二次到线性。此外,我们为稍微受到限制的模型提供了一种算法,该算法在大型模型中获得了一个甚至较小的错误,但许多例外。在随机环境中,我们提供了第一种算法,该算法以多项式样本复杂性收敛到异常速率。我们对随机设置的算法和分析涉及我们称之为特征影响的新结构,这可能是更广泛的适用性。
translated by 谷歌翻译
我们提出了仅使用总人群统计数据来推断给定分类器的公平性和准确性的方法。当无法获得单个分类数据时,例如,当无法访问分类器或代表性的个人级验证集时,这是必要的。我们研究有关均衡的赔率标准的公平性,我们将其推广到多类分类。我们提出了有关该标准的不公平性的度量,该标准量化了不公平处理的人群的比例。然后,我们显示如何仅使用汇总标签统计信息(例如每个子人群中每个标签的预测率,以及每个标签的真实速率),如何获得给定分类器的不公平和误差的推断。我们为二进制分类器和多类分类器提供了推理程序,对于每个子人群中的混淆矩阵以及未知的情况下更具挑战性的情况而言。我们报告了代表不同应用的数据集的实验,这些实验证明了所提出方法的有效性和广泛使用。
translated by 谷歌翻译
随着深度神经网络(DNN)的发展以解决日益复杂的问题,它们正受到现有数字处理器的延迟和功耗的限制。为了提高速度和能源效率,已经提出了专门的模拟光学和电子硬件,但是可扩展性有限(输入矢量长度$ k $的数百个元素)。在这里,我们提出了一个可扩展的,单层模拟光学处理器,该光学处理器使用自由空间光学器件可重新配置输入向量和集成的光电,用于静态,可更新的加权和非线性 - 具有$ k \ \ 1,000 $和大约1,000美元和超过。我们通过实验测试MNIST手写数字数据集的分类精度,在没有数据预处理或在硬件上进行数据重新处理的情况下达到94.7%(地面真相96.3%)。我们还确定吞吐量($ \ sim $ 0.9 examac/s)的基本上限,由最大光带宽设置,然后大大增加误差。我们在兼容CMOS兼容系统中宽光谱和空间带宽的组合可以实现下一代DNN的高效计算。
translated by 谷歌翻译
量子光学器件中的自发参数下转换是实现具有空间光模式的高维QUITIES的宝贵资源。主要开放挑战之一是如何在SPDC过程中直接生成所需的Qudit状态。通过高级计算学习方法可以解决这个问题;然而,由于通过考虑所有互动效应的完全可分辨率算法对SPDC过程建模的困难,进展有限。在这里,我们克服了这些限制并引入了物理受约束和可微分的模型,验证了针对形状泵浦梁和结构晶体的实验结果,能够在过程中学习每个交互参数。我们避免了我们物理模型随机性质引起的任何限制,并整合了在SPDC Hamiltonian下的演变的动态方程。我们解决了设计非线性量子光学系统的逆问题,该系统实现了降低的光子对的所需量子状态。使用不同空间模式之间的二阶相关性或通过指定所需的密度矩阵来定义所需状态。通过学习非线性卷全息图以及不同的泵形状,我们成功地展示了如何生成最大纠缠的状态。此外,我们通过主动改变泵浦光束的轮廓来模拟产生的量子状态的全光相干控制。我们的工作对于高维量子密钥分布和量子信息处理协议等新颖设计有用。此外,我们的方法可以容易地应用于控制SPDC过程中的其他光度的其他光度,例如光谱和时间特性,甚至可以用于具有类似相互作用Hamiltonian的冷凝物系统。
translated by 谷歌翻译
我们考虑组合纯勘探(CPE)的问题,该问题涉及在进行各个臂的卷筒未知的情况下,找到具有高奖励的组合组或臂,并且必须使用臂拉估计。以前的算法用于这个问题,同时获得许多情况下的样本复杂性减少,高度计算密集,因此即使对于温和的问题,也使它们不切实际。在这项工作中,我们提出了一种新的CPE算法在PAC设置中,该算法是计算重量的重量,因此可以很容易地应用于数万臂的问题。这是实现的,因为所提出的算法需要非常少量的组合Oracle调用。该算法基于连续接受武器,以及消除基于问题的组合结构。我们为我们的算法提供了样本复杂性保证,并在实验中展示其对大问题的有用性,而先前的算法是不切实际的,以延长几十个武器的问题。 HTTPS://github.com/noabdavid/csale提供了算法和实验的代码。
translated by 谷歌翻译
我们研究了在观察环境中贝叶斯网络的主动结构学习,其中可以从同一样本中观察到可变值数量的外部限制。随机样品是从网络变量的关节分布中得出的,算法迭代选择了在下一个样本中观察的变量。我们为此设置提出了一种新的主​​动学习算法,该算法的概率很高,其得分为$ \ epsilon $ -Close的结构达到了最佳分数。我们表明,对于我们称为稳定的一类分布,可以获得示例复杂性降低到$ \ widetilde {\ omega}(d^3)$,其中$ d $是网络变量的数量,其中$ d $是。我们进一步表明,在最坏的情况下,积极算法的样品复杂性保证与天真基线算法的样本复杂性几乎相同。为了补充理论结果,我们报告了将新活性算法与天真基线的性能进行比较的实验,并证明了样品复杂性的改善。在https://github.com/noabdavid/activebnsl上提供了算法和实验的代码。
translated by 谷歌翻译